布林索引又稱布林選取,就是使用布林陣列來篩選資料的方法。
先對DataFrame的其中一個欄位進行條件判斷,進而得到一個布林陣列,再從中計算摘要統計資訊。
先匯入資料
import pandas as pd
fruit={'蘋果':{'小明':8,'小美':3,'小英':4,'小玉':2,'小翔':6,'小意':7,'小平':9,'小亮':10},'香蕉':{'小明':4,'小美':6,'小英':8,'小玉':9,'小翔':2,'小意':4,'小平':6,'小亮':5}}
fruit1=pd.DataFrame(fruit)
print(fruit1)
執行結果:
蘋果 香蕉
小明 8 4
小美 3 6
小英 4 8
小玉 2 9
小翔 6 2
小意 7 4
小平 9 6
小亮 10 5
想知道對蘋果喜好程度大於6的有那些成員,利用運算篩號進行篩選後,傳回一個布林陣列。
fruit2=df1['蘋果']>6
print(fruit2)
執行結果:
小明 True
小美 False
小英 False
小玉 False
小翔 False
小意 True
小平 True
小亮 True
Name: 蘋果, dtype: bool
由於布林陣列中的True及False分別對應到1和0,因此可以用sum()算出超過喜好度超過6的成員總數。
fruit2.sum()
執行結果:
4
使用mean()再乘上100,可算出喜好度超過6成員的百分比。
fruit2.mean()*100
執行結果:
50.0
將describe()套用在布林陣列上,進行輸出統計資訊摘要。
fruit2.describe()
執行結果:
count 8
unique 2
top True
freq 4
Name: 蘋果, dtype: object
學會進一步使用布林值了,吃完月餅,明天再來繼續吧~